查看原文
其他

英伟达2023 | 量子、AI、芯片......未来已来!

光子盒研究院 光子盒 2023-04-26
光子盒研究院出品


3 月 21 日晚上 11 点,伴随着英伟达 CEO 黄仁勋的演讲,AI盛会GTC 2023 正式展开。


“AI 的‘iPhone 时刻’已经到来”,在英伟达 GTC 2023 大会上,英伟达 CEO 黄仁勋把这个观点反复说了4、5遍。

不止英伟达,昨天晚上,微软、谷歌、Adobe 等厂商在相差无几的时间里都推出了各自的 AI 服务,你追我赶之势仿佛在传达着同一个焦虑:“在这个大 AI 时代,如果不想被人颠覆,就要先颠覆别人。”这一夜里,我们见证了 AI 领域从服务层到应用层的几个大突破。我们的生活正在被 AI 日新月异地改写。

如今,2023 年 GTC 开发者大会现已进入第 14 个年头,届时将有 650 场 AI 开发领导者的演讲。英伟达的首席执行官黄仁勋的主题演讲涵盖了英伟达及其合作伙伴如何提供从培训到尖端服务部署的一切服务。在去年推出 ChatGPT 之后,这位首席执行官表示:“我们正处于 AI 的 iPhone 时刻。” 今年,黄仁勋讨论了英伟达及其合作伙伴如何寻求利用 AI 技术克服广泛的挑战。


此次,与以色列公司Quantum Machines共同构建的新系统为从事高性能和低延迟量子经典计算的研究人员提供了一个革命性的新架构。


作为全球首个GPU加速的量子计算系统,NVIDIA DGX Quantum将全球最强大的加速计算平台(由NVIDIA Grace Hopper超级芯片和CUDA Quantum开源编程模型实现)与全球最先进的量子控制平台OPX(由Quantum Machines提供)相结合。


这种组合使研究人员能够建立异常强大的应用,将量子计算与最先进的经典计算相结合,实现校准、控制、量子纠错和混合算法。


英伟达公司HPC和量子主管Tim Costa表示:“量子加速的超级计算有可能重塑科学和工业,其能力可以以巨大的方式为人类服务。NVIDIA DGX Quantum将使研究人员能够突破量子-经典计算的界限。”

DGX Quantum的核心是一个由PCIe连接到量子机OPX+的NVIDIA Grace Hopper系统,实现了GPU和量子处理单元(QPU)之间的亚微秒级延迟

DGX Quantum还为开发者配备了英伟达混合GPU-Quantum编程模型——CUDA Quantum,这是一个强大的统一软件栈,现在已经开放源代码了。CUDA Quantum是一个混合型量子-经典计算平台,能够在一个系统中整合和编程QPU、GPU和CPU。

新平台以 CUDA 命名,CUDA 是大多数 AI 开发人员用来访问英伟达图形处理单元 (GPU) 的软件,它为英伟达芯片带来了巨大的竞争优势;同时,这也是首个使用流行的经典计算机编码语言 C++ 和 Python 构建量子算法的平台。该程序将有助于在量子计算机和经典计算机上运行算法,具体取决于哪个系统在解决问题方面最有效。

“CUDA Quantum 将为量子计算做同样的事情,使领域科学家能够将量子无缝集成到他们的应用程序中,并获得新的颠覆性计算技术,”Nvidia HPC 和量子主管Tim Costa表示,虽然 CUDA 是专有的,但 CUDA Quantum 是开源的,并且是在许多量子计算公司的投入下开发的


最后,英伟达宣布了一批将CUDA Quantum集成到其平台的新合作伙伴,包括量子硬件公司Anyon Systems、Atom Computing、IonQ、ORCA Computing、Oxford Quantum Circuits和QuEra;量子软件公司Agnostiq和QMware;以及超级计算中心国家高级工业科学和技术研究所、信息技术科学中心(CSC)和国家超级计算应用中心(NCSA)。

在量子计算板块的结尾,Tim Costa说道:“今天所有的量子都是研究,而不是生产,短期内这不会改变,”他补充说,不过,借助 DGX Quantum,研究人员将能够为量子计算的未来开发混合应用程序和关键方法。


1999年,英伟达定义了GPU,GPU的出现被业界视为现代计算机图形技术的开端。然而GPU的微架构天生适合矩阵类并行计算,其能力不仅限于显卡领域,于是从21世纪早期就有专业的计算人员想要使用GPU做一些人工智能领域相关的并行计算。

现在,GPU已然成为了AI通用芯片、人工智能的主要驱动力。

在昨天的GTC大会上,英伟达推出全新GPU:4种配置(L4 Tensor Core GPU、L40 GPU、H100 NVL GPU、Grace Hopper超级芯片)、一个体系架构、一个软件栈,分别用于加速AI视频、图像生成、大型语言模型部署和推荐系统。


1)L4:针对AI视频设计的通用GPU,可提供比CPU高120倍的AI视频性能,能效提高99%;优化了视频解码与转码、视频内容审核、视频通话等功能,如背景替换、重新打光、眼神交流、转录和实时翻译等。


2)L40:用于图像生成,针对图形和AI支持的2D、视频和3D图像生成进行了优化,推理性能是英伟达最受欢迎的云推理GPU T4的10倍。


3)H100 NVL:这种新的、有双 GPU NVLink 的 H100 NVL基于英伟达的 Hopper 架构,并采用 Transformer Engine 设计来处理模型,例如为ChatGPT提供支持的 GPT 模型。相比之下,采用双 GPU NVLink 的新款 H100 在 GPT-3 处理方面比之前的 HGX A100 快 10 倍。


4)Grace Hopper超级芯片:新型超级芯片 Grace Hopper 通过高速 900GB/秒的连贯芯片到芯片接口连接 Grace CPU 和 Hopper GPU。据黄仁勋说,新的超级芯片据说是处理大型数据集的理想选择,例如用于推荐系统和大型语言模型的 AI 数据库。Grace Hopper 非常适合希望构建大几个数量级的 AI 数据库的客户。


对于上述突破,黄仁勋表示,英伟达DGX H100是寻求在全球范围内建立人工智能基础设施的客户的蓝图,现在已经全面投入生产。

事实上,H100人工智能超级计算机已经开始上线,包括已宣布的甲骨文云基础设施。亚马逊网络服务也宣布了其EC2 UltraClusters的P5实例,其规模可以扩展到2万个互连的H100 GPU。

为了向努力带来新产品和制定AI战略的初创公司和企业加快DGX能力,黄仁勋宣布了NVIDIA DGX Cloud。这项新的云技术将通过与微软Azure、谷歌云和甲骨文云基础设施的合作,将英伟达DGX AI超级计算机“从浏览器中带到每个公司”。


英伟达将与云服务厂商展开合作,让客户可以使用网页浏览器,能通过 NVIDIA DGX Cloud 来使用 DGX 计算机,从而训练和部署大型语言模型或完成其他 AI 工作负载。

英伟达已经与甲骨文展开合作,预计下个季度微软 Azure 也会开始托管 DGX 云,而谷歌云也将在不久之后加入这一行列,以托管的方式向那些有意愿构建新产品和发展 AI 战略的企业提供 DGX 云服务。

黄仁勋称,这种合作关系将英伟达的生态系统带到了云服务商手中,同时扩大了英伟达的市场规模和覆盖面。企业将能够每月租用 DGX 云集群,确保他们能够快速轻松地扩展大型多节点 AI 训练。

同时,黄仁勋推出了NVIDIA AI Foundations。它由一系列云服务组成,供需要建立、完善和操作定制的LLM和用专有数据训练的生成性AI的客户使用,并用于特定领域的任务。它还会与Adobe的合作,为未来的创造力建立一套下一代的人工智能能力。


AI Foundations 的服务包括 NVIDIA NeMo,用于构建文本-文本的生成模型;毕加索,一种视觉语言模型制作服务,面向希望构建基于经授权内容训练模型的用户;以及 BioNeMo,帮助生物医药研究人员。


面向元宇宙领域,英伟达推出了第三代OVX计算系统和新一代工作站,为基于NVIDIA Omniverse Enterprise的大规模数字孪生提供动力。


第三代OVX服务器通过组合双CPU平台、BlueField-3 DPU、L40 GPU、两个ConnectX-7 SmartNIC和NVIDIA Spectrum以太网平台,提供了突破性的图形和AI性能,可加速大规模数字孪生模拟等应用,进而提高运营效率和预测性规划功能。


企业可以利用OVX性能在可视化、虚拟工作站和数据中心处理工作流程等方面进行协作。

此外,黄仁勋还宣布了英伟达用于构建和操作元宇宙应用的平台NVIDIA Omniverse的相关更新,增加了一系列生成式AI、模拟仿真相关功能,让开发者能够更轻松地部署工业元宇宙应用。

平台即服务(PaaS)NVIDIA Omniverse Cloud现已面向特定企业开放,使企业能够在其核心产品和业务流程中统一数字化。

除了软件,英伟达的硬件“亮点”是秘密研发四年、向芯片制造业甩出的技术“核弹”——通过突破性的光刻计算库cuLitho,它将计算光刻加速40倍以上,使得2nm及更先进芯片的生产成为可能。全球最大晶圆厂台积电、全球光刻机霸主阿斯麦、全球最大EDA巨头新思科技均参与合作并引入这项技术。

在主题演讲的最后,黄仁勋感谢了英伟达的合作伙伴,并表示:“生成式AI将重塑几乎所有行业。我们正在共同帮助世界完成不可能完成的任务。

英伟达是GPU的发明者,也是人工智能计算的引领者。今年以来,量子计算+人工智能的交叉研究越来越多,随着英伟达此次在GTC大会上更新GPU、入局量子计算,二者融合将进一步加快。

参考链接:
[1]最卷一夜,英伟达、谷歌、微软、Adobe等巨头争相发布AI服务 |【经纬低调分享】 (qq.com)
[2]黄仁勋向台积电放核弹!干掉40000台CPU服务器,计算光刻提速40倍 (qq.com)
[3]https://www.nvidia.com/gtc/?ncid=pa-srch-goog-729287-prsp
[4]https://hothardware.com/news/nvidia-gtc-2023-keynote-ai-everywhere-all-at-once
[5]英伟达曝 AI 专用「核弹」:GPT 速度提高 30 倍,三大云厂商抢着买 | 极客公园 (geekpark.net)


相关阅读:
美国禁止向中国销售高端GPU芯片,英伟达:预计季度损失4亿美元
挑战英伟达,国产通用GPU芯片创下全球算力记录
量子版CUDA,英伟达发布革命性QODA编程平台
英伟达:通往混合量子-HPC之路
英伟达正式发布基于GPU的量子电路模拟SDK

#光子盒视频号开通啦!你要的,这里全都有#
每周一到周五,我们都将与光子盒的新老朋友相聚在微信视频号,不见不散!
你可能会错过:|qu|cryovac>

|qu|cryovac>

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存